查看原文
其他

网易杭研受邀参加AiDD,分享玉言NL2SQL领域大模型实践

领域大模型,即利用大规模领域数据和深度学习技术构建的适用于特定领域的高性能大模型。这类模型通过深入理解领域知识和数据特征,能够提供更准确的预测、改善决策和优化系统性能。基于领域大模型,开发者能够加快应用开发速度,更能显著提升该领域的业务能力

11月24-25日,AI+软件研发数字峰会(AiDD)在深圳举办,在由网易副总裁、网易杭州研究院执行院长、网易数帆总经理汪源担任出品人的“领域大模型”论坛上,来自浙江大学、网易数帆、WakeData和招商银行的技术专家们深入讨论了领域大模型的最新实践。其中,网易数帆资深算法工程师李家诚分享了玉言NL2SQL领域大模型的研发及其在数据分析产品有数ChatBI中的落地。

李家诚表示,结合来自网易杭州研究院的“玉言NL2SQL领域大模型”,和网易数帆大数据团队的产品交互设计、工程化能力,ChatBI产品已经支持非专业用户通过自然语言与BI平台进行交互,实现数据查询和分析,开启数据分析新范式

玉言NL2SQL领域大模型

玉言NL2SQL领域大模型是网易杭州研究院知识增强领域大模型家族的核心实践之一。知识增强领域大模型方法论的提出,是为了解决通用大模型在企业落地中存在的行业理解有限、知识陈旧、使用成本高等挑战。
在网易自研的玉言大模型基座之上,领域大模型专注垂直领域专业数据和知识对专业理解更精准,知识增强技术则相当于给大模型外挂了个性化知识库,能够提升细分领域问题的解决率

玉言NL2SQL领域大模型的任务,是将自然语言问题(NL)转换为可在数据库中执行的结构化查询语言(SQL)

李家诚介绍:

玉言NL2SQL领域大模型是使用中文互联网开源的表格和SQL代码数据集,以及网易集团内部积累的表格及SQL代码数据集,以提升自然语言生成SQL代码的准确性为训练目标,对玉言大模型基座进行继续预训练和指令微调训练得到的。


继续预训练阶段的核心工作是数据清洗和数据标准化,在此阶段网易杭州研究院投入了200B Token无标注的高质量语料,包括通用、代码、问题、SQL等。在监督指令微调阶段则采用了Self-instruct的方法构造指令数据,并采用了基于LoRA的高效微调方法,以更低的投入来获取全参数微调的效果。为提升模型准确性,网易杭州研究院构造的指令微调数据达到了百万自然语言问题和SQL对覆盖十万数据表十大领域百个子领域

网易杭州研究院还构建了一套更贴近业务场景的NL2SQL评测方案,以解决学术界评测方案存在的不足,如实际业务场景下查询语句(query)更偏口语化、模糊意图查询下有多个正确答案、评测指标准确性不够等,从而确保SQL执行结果和SQL逻辑完全符合query的要求。在这一严谨的评估方案下,玉言NL2SQL领域大模型在数据分析场景下整体性能优于GPT-4

产品工程能力成就可信ChatBI

根据网易实践经验,前沿技术成果转化成功的一个大前提是新技术能够降低操作门槛、为业务提效,大模型的成功落地也不能例外。这是产品工程团队必须解决的问题。
事实上,从NL2SQL领域大模型的研发开始,工程化就已经存在。单纯从BI取数的角度,大模型的落地就有NL2SQL和NL2JSON两条路线可以选择,而后者对多数据源、复杂查询的支持更好,更加匹配企业对数智化升级的期待。但问题是,JSON生成错误难以补救,且无法承载用户所有的自然语言提问,即使靠Prompt优化也解决不了,所以产品工程团队团最终选择NL2SQL路线。

当然,并不是说NL2SQL面前就是一马平川的大道。从NL2SQL到ChatBI产品落地,仍然存在着业务知识理解不可控、无法保证结果百分百可信、上千张表的长序列输入不支持、推理速度慢、资源成本高等挑战。

知识增强技术在ChatBI的实践,是在产品中开发了个性化知识配置功能,让大模型进一步学习行业知识和“黑话”,适配定制化问题和问法。同时,建立并依赖反馈机制,使得大模型能够参考历史查询内容自动迁移、修正,达到“越用越聪明”的效果。总体来说,ChatBI对于玉言NL2SQL领域大模型的知识增强,主要包括了表格内容、业务知识和历史查询等三类知识。
“可信”的实现,则包括了需求可理解、过程可验证、用户可干预和产品可运营四个方面,这充分发挥了网易公司在产品层面的优势,使得不懂SQL的非专业用户群体,也能判断ChatBI返回的结果是否可信。

01



需求可理解

借助大模型的语言理解能力,先进行需求分析,这样即使是完全不懂BI的使用者也能通过需求分析内容判断系统的取数步骤是否正确。

02



过程可验证

不仅仅生成SQL查询语句,还使用一个查询语句解析引擎将其解析为人类可理解的语言,以确保用户了解模型的执行过程。如果发现错误,用户可以立即识别并不信任结果。

03



用户可干预

允许用户对模型生成的查询进行干预。用户可以更改条件、切换表格等,以纠正错误或调整查询。这提供了用户对结果的额外控制。

04



产品可运营

产品不是一个静态的工具,而是能够随着用户的使用变得更智能。通过收集用户的行为习惯,正例和反例,结合个性化知识配置和不断的运营,模型能够变得越来越智能,越来越适应用户的需求。

通过这些措施,有数ChatBI将大模型生成的复杂SQL转换成易于理解的自然语言描述,能做到查询条件自然语言描述和数据结果完全一致,确保用户的每一次查询都是透明和可验证的。


李家诚说:“虽然大模型会产生幻觉和不稳定,但有数ChatBI的用户能轻松判断取数逻辑是否正确、该数据是否可用,产品的可信赖度100%。”

在解决大模型长序列问题上,网易数帆采用了调整旋转角和限制注意力窗口等技术,使得大模型能够接受更长的输入、进行更快速的推理。同时,工程上也采用了更合适的推理框架及模型量化等加速手段,使得玉言NL2SQL领域大模型推理速度在准确率不变的前提下提升1.5倍

结  语

目前,ChatBI不仅在网易内部广泛应用,还逐步在行业客户场景下开启了深度试用之旅。ChatBI的成果,验证了知识增强领域大模型特色技术的领先性和可行性。事实上,这一技术还已经用于为网易数帆EasyData、CodeWave、轻舟云原生等核心产品增强智能特性,以及在医疗文献领域为医疗科研工作智能化加速。

了解更多
活动预告 | 两场干货分享,详解知识增强领域大模型技术实践
又一领域大模型!网易杭研与浙江省人民医院携手共建

杭研大咖说 | 网易杭研如何抓住大模型的价值

修改于
继续滑动看下一个
网易杭州研究院
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存